자연어학처리4-태깅 | ◈자연어학◈ :: 개발참고자료[SSISO Community]
 
SSISO 카페 SSISO Source SSISO 구직 SSISO 쇼핑몰 SSISO 맛집
추천검색어 : JUnit   Log4j   ajax   spring   struts   struts-config.xml   Synchronized   책정보   Ajax 마스터하기   우측부분

개발참고자료
[1]
등록일:2008-04-07 12:33:34 (0%)
작성자:
제목: 자연어학처리4-태깅 | ◈자연어학◈

자연언어는 어휘, 구문, 의미수준에서 본질적으로 많은 중위성(ambiguity)을 지니고 있다. 따라서  가공되지 않은 원시 말뭉치(raw corpus)를 그대로 사용할때는 중의성으로 인하여 정확한 언어 정보를 추출하여 이용하는데 어려움이 있다. 하지만 원시 말뭉치에서 중의성을 해소하여 부가적인 언어 정보를 부착하면 이러한 어려운 점을 극복할수 있다. 이때 부가된 언어정보 태그(tag)라고 하고, 이렇게 태그가 부착된 말뭉치를 태그 부착 말뭉치(tagged corpus)라고 한다. 그리고 이와같이 태그를 부착하는 작업을 태깅(tagging)이라고 하며 태깅을 수행하는 컴퓨터 프로그램을 태거(tagger)라고 한다. 그런데 태깅이라는 용어가 반드시 말뭉치에 대해서 수행되는 작업만을 지칭하는것은 아니다.예를 들어 기계번역에서 입력 문장의 품사 중의성을 해소하여 품사를 결정하는 작업도 입력문장에 품사라는 태그를 부착하는 작업으로 볼수있다. 이와 같이 태깅을 일종의 중위성 해소작업으로 간주할수 있으며, 태깅의 유형은 중위성의 유형에 따라 어휘, 구문, 의미 태깅으로 구분해 볼수 있다

어휘태깅--흔히 품사태깅(part-of-speech tagging)

구문태깅(syntactic tagging)---트리태깅(tree tagging)--bracketing

넓은 의미에서의 태깅은 어휘,구문, 의미 태깅을 포함한다.

태깅에 사용된 주요 접근 방법은 크게 규칙 기반 접근법(rule-based approach), 통계적 접근법(stochastic approach),  이 두가지 접근 방법을 결합한 복합적 접근법(hybrid approach) 세가지로 구분한다.



출처 : http://blog.daum.net/autumn78/8068135

[본문링크] 자연어학처리4-태깅 | ◈자연어학◈
[1]
코멘트(이글의 트랙백 주소:/cafe/tb_receive.php?no=7317
작성자
비밀번호

 

SSISOCommunity

[이전]

Copyright byCopyright ⓒ2005, SSISO Community All Rights Reserved.